"""
演示RRD的reduceByKey成员方法使用
"""
"""
from pyspark import SparkConf,SparkContext
import os
os.environ['PYSPARK_PYTHON'] = "python解释器路径"
conf = SparkConf().setMaster("local[*]).setAppName("test_saprk")  #可以自定义名字
sc = SparkContext(conf = conf)

#准备一个RDD
rdd = sc.parallelize([('男',99),('男',88),('女',94),('女',98)]])   #结果 男：99+88；女：94+98
#男女生两个组的成绩和
rdd2 =  rdd.reduceBYKey(lambda a,b:a+b)
print(rdd2.collect())


"""